查看原文
其他

王贺 | 数字人文内外:近现代文史研究中图像资料的检索、利用及研究

王贺 上师大数字人文 2023-04-27

数字人文内外:近现代文史研究中图像资料的检索、利用及研究


王 贺

(上海师范大学数字人文研究中心)



《图书馆建设》2021年第2、3期刊载《俄文资料专门搜索引擎yandex.com——兼谈图片搜索》《再谈图片的搜索:钱穆先生的一张旧照》二文,读来颇感兴味。事实上,之所以关注此类问题,除了因其多属于笔者所理解的文献学、图书馆学的研究范围,还由于本人与此二文作者拥有几乎相同的经验和记忆。说来惭愧,笔者虽非此二领域专家,但也时常接到海内外师友、出版社和报刊社编辑朋友,嘱代为查询某种文献资料的请求。犹记得多年之前,文汇报社、上海社科院出版社的两位朋友,差不多同一时期发来两张不同的历史图片,请我查询其出处、作者及创作年代等相关信息,后来当然顺利查到,不过,这却使我意识到:原来图像资料的检索并不简单,远非人人熟知而不必大张旗鼓的“常识”。此后,随着对数字人文学习和思考的不断深入,更加感到图像资料的检索、利用,并不能被局限于数字资源的检索、利用,或数字文献学的范畴,实可被视作数字时代普通公民应该具备的“数字读写能力”(digital literacy,也译作“数字素养”)之一种,有必要作出专门的研究和分析。


但是,若要笔者总结检索图像资料的方法和作业程序,和本文起首提到的两篇文章一样,似乎卑之无甚高论。其工作原理无外乎是,利用目前技术已相对成熟的图像搜索引擎和诸多专业或通用型数据库,辅以我们掌握的其他信息(主要是文字信息),将其作为主题词、关键词(当然也包括其他更为复杂的检索技巧和检索策略,对此下文将有所论述),键入数据库和搜索引擎检索相关的图像资料,及文字资料中有关此图像的记载(特别是二手研究等),使两方面工作不断配合,直至能找到我们所需要的图像资料,或是关于这一图像资料的其他重要信息,顺利得出较为准确、可靠的结论为止。另外,前举二文还强调了访问专业人士、利用外文资料搜索引擎的重要性,这是毋庸置疑的,除了利用数据库与互联网,图书馆、档案馆、博物馆、艺术馆甚至私人藏书室,也都可以为我们提供不同程度的帮助。


但是,本文关心的是,除此之外是否还有一些值得思考的方面?在使用这些来自互联网、数据库的图像资料时,有哪些问题需要引起注意?其与对图像资料的专门研究之间有何关系?另外,我们应该怎样认识图像资料检索、利用这一行为?这些问题有些属于传统的文献学、图书馆学、档案学、信息资源管理等领域的研究范畴,有些是一般性的数字人文研究中比较关心的问题,有些则与各学科专业领域(包括文学、史学、艺术学、传播学等)的专门研究有关。但无论如何,以上问题都需要予以关注和讨论,本文将做出初步尝试。


1

图像检索方法及作业程序


关于图像资料的检索方法及作业程序,从笔者对包括图像资料在内的一切文献资料的检索、利用经验来看,尚可补充以下几个方面。


其一,我们需要区分两种情形:有图像而查找其作者、来源等信息;没有图像、需要查找一张或多张图像。这两种情形有完全不同的检索策略。实际上,《图书馆建设》所刊二文只讨论了前一种情形,但即便就此而言,也许应该指出的是,利用“以图搜图”类的图像搜索引擎只是开始一个检索的入门和基础,有时并不能奏效,因为大量的作为历史档案和文献的图像资料,由于种种原因,并未被图像搜索引擎建立索引,无法被我们搜索得到。图像搜索引擎的运作原理是:在其此前已经建立的大量图像资料索引的基础之上,利用一定的算法和模型对新的图片进行图像相似性识别(这一技术的早期版本为文本相似性识别,至今已被广泛应用于教学、研究及日常生活各个领域),直至发现与其重合程度较高的图片,并给出其来源。但如果是后一种情形,没有图片导致无法使用图像搜索引擎,我们又该如何处理?根据我个人的经验,后一种情形似乎更是专业研究者常常碰到的,如寻找某一近现代文学作品的某个版本的书影、某一名家在某一时期某一地方的照片等,即属此类。


其二,针对不同主题、类型的图像资料,选择合适的网站和数据库很关键通用型的网站和数据库如“读秀学术搜索”等,当然有它的长处,正如其所宣称的那样,是目前世界上最大的中文知识库,用户可以对其所收录的数百万种中文图书、期刊、报纸等资源类型进行全文检索和试读、通览。但问题是,它的全部检索服务是基于文字而非图像之上的,一张图片资料能够被我们在“读秀学术搜索”查询到,取决于它在某本书或报刊中提供的文字信息,而并非图像本身,这是其之于图像资料搜索的致命缺陷,也注定了我们在利用这一资源时,只能较多地搜寻前述第二种情形下的图像资料。


也因此,笔者认为,比这些通用型的网站和数据库更关键的是,我们应该根据自己需要的图像资料主题、类型,选择更加专业的数据库和网站,进行充分的检索。例如,当我们想要寻找张爱玲旅居美国时期的照片、当时留下的手稿的图像时,也许应该优先选择美国南加州大学图书馆建立的“张爱玲文献”数据库“Ailing Zhang (Eileen Chang) Papers,1919-1994”进行检索。这是一个免费的小型数据库,收录了张爱玲在美期间的文章和演讲(5种)、通信(138通)、手稿(2种)、照片(45张)。这些图像除了清晰度不够高,著录、标注均较完善。如果要寻找胡适的档案、手稿、通信、照片等,我们首先就要考虑台北中研院近代史研究所胡适纪念馆开发的“胡适档案检索系统”。这同样是一个免费的专题数据库,但其数据体量较前者大很多,阅览、打印等功能需向馆方提出申请,经批准后方可使用。当然,在开始这些更加专业的检索之前,我们需要了解和掌握有哪些相应的、专门的数字资源可以使用。这也是本文接下来要讨论的内容。


其三,选定合适的网站和数据库之后,要充分地了解其所要求匹配的检索技巧、策略,进行检索。换言之,除了常用的基本检索方式,如须选择相应的栏位搜索关键词并搭配通配符或截词符等,也需要根据特定的网站和数据库提供的“高级检索”“出版物浏览与检索”“命令行检索”(也被称作“布尔逻辑检索”)等功能,查找我们的目标资料。有些大型数据库,甚至专门建有“检索技巧”的网页(或是“帮助”文件),可以给我们提供必要的帮助。例如,在ProQuest平台上,想要查找其中的图像资料,我们可以在输入要检索的词语同时,再加上字段名称的缩写DF(Document feature),就可以找到内文包含有图像的资料。以下的个案来源于对该平台杂志(本文仅选择杂志这一特定的出版物类型为例)中关于“上海”的图像资料的搜索:


图1  ProQuest平台高级检索界面


执行检索之后所得结果如下:


图2 ProQuest平台高级检索结果


检索所得结果还不少。那么,如何才能知道每一栏位的命令代码呢?实际上,对这些代码及相应的检索方式的说明,就在该平台首页的“检索技巧”页面。点击“检索技巧”,进入相应的网页后,我们即可找到如下内容:


图3  ProQuest平台检索技巧界面


总之,充分了解某一网站或数据库所要求匹配的检索技巧、策略,进行有针对性的检索,甚至进一步参考相关的检索研究成果[1],对图像检索方法的技术原理及其历史,如早期基于文本,后基于内容,现已发展出基于卷积神经网络和哈希技术的图像检索方法等[2]多所了解,可在很大程度上帮助我们快速、准确地找到自己需要的资料,包括图像资料。


2

利用图像资料应予注意之点


在找到我们需要的图像资料以后,接下来就是如何使用的问题。这一问题虽然在很大程度上已经超出了“图像资料的检索”这一论域,与专业研究更加密切相关,但无论是对于图书馆从业人员而言,还是以图像资料作为其研究资料的文史研究者来说,都是颇为关键的。对此,《图书馆建设》所刊二文并未讨论,兹作申述如下:


其一,在使用这些图像资料时,我们还需要仔细考察其基本的真伪情况,即是否为“原图”的忠实再现。换句话说,数字资源和纸质文献一样,需要经过我们的批判性考察(如果说不是更需要的话)。笔者曾经在一篇书评论文中,以现代文学版本图像资料的利用为例,发表过这样的评论:


事实上,迄今为止,学者们对现代文学版本的图像资料的搜集、利用普遍既无浓厚兴趣,也充满了误解、偏见。举例来说,在其发表、出版的专书和论文,运用到这些版本的图版时,作者和编辑往往就会利用诸如Windows系统自带的“画图”工具及Adobe Photoshop、CorelDraw、美图秀秀等常用图像处理软件,对原图进行修改。当然,这一修改有时是出于美观、版面编辑的需要(近似于影印图书时的“修版”,但至少利用修版后的影印古籍所作语言、文字学等方面的研究,其结论便要打折扣) ,有时是为了避免可能的版权的争议,但无论何种情形,都既没有任何交代、说明,取舍也显得相当主观、任意。这样一来,其所谓的“原汁原味”的“原图”,实已变身为“伪文献”、“伪史料”,势必带来很多问题。


在这些“原图不原”的图像资料中,公家机关图书馆、资料室的藏书章常常会被修掉。其实,哪怕是被修掉的某一图书馆章,也是很重要的研究线索。近现代的铅印书籍可能暂时还没到讲究、考虑这些问题的时候,但对于一本古书来说,其上的藏书章如被修除,姑不论其他,单是对于我们了解它的递藏、流传有序,恐怕就很难着手了。因为这本书在一定时间内很可能其他人都很难看到,只有此研究者一人能够读到。倘若我们又假设那本书只有某地某校图书馆所藏,其他人见此图片,而想要检查、借阅实物,一旦没有了这个标记,便无门径可寻。《中国现代文学初版本图鉴》(下简作《图鉴》)的编著者在搜集这些现代文学版本及其图像资料时,就有过这方面的遭遇。他们发现,即使是在原书保存在公立图书馆的情况下,有时也因编目混乱、收藏不善等,不得不面对有书无目、见非所查的尴尬局面。 这从相反的方向揭示了文献保存、流传这一信息的重要性。


但这仅是初版本在内的现代文学版本及其图像资料中附加或承载的一个方面的信息、线索。一般研究者无此概念、导致“原图不原”的现况尚可理解,令笔者感到担忧的是,一些致力于文献史料整理、研究的学者,在这方面有时也表现得无甚差别,对文献史料之真伪之区隔漠不关心,然而,其所提供于读者的所谓“原汁原味”的“原图”,许多既已经过处理、修改,又如何让人放心参考、利用?更何况,在大量的出版物,包括现代文学研究专书中,“图像”常常仍只扮演着一个“插图”的角色,显得可有可无,遑论专门之搜集、整理与研究。[3]


但这一情况此后并未得到明显改善。另外,许多专业数据库号称是对原始文献、图像的照相或扫描加工制作,但据笔者了解,包括从笔者参与建设多个专题数据库的经验中可以知道,其中仍有部分资料,由于种种原因是经过内容修改、处理之后上传的,并不能被称之为“原始文献”,这是尤其需要注意的。从严格意义上来说,一切数据库、网站所谓的“原始文献”都只能被看作“原始文献”的数字化版本(有时也被我们称为复制件、影印件、电子版等),不能与原本、原始报刊等纸质、实物“原始文献”相提并论。


其二,在使用这些图像资料时,我们也需要注意遵守版权方的规定。一般而言,大多数专业网站和数据库的图像资料都得到了版权持有人的授权,但在其数字化之后拥有了新的知识产权,有些是采用知识共享(Creative Commons,简称CC)协议,支持非商业使用。无论何种情形,其目标都是为促成向用户提供免费或购买之后的服务。但这并不意味着用户或读者就可将所下载的图像资料无限复制、分发,随意上传于包括个人社交媒体账号等在内的网络空间,或在未取得合法授权的情况下,用于出版、教学甚或可能与商业利益相关的项目。简而言之,在传播这些资料之前,我们应该持以谨慎的态度,尽可能评估其知识产权,以免陷于不必要的争议和可能的法律纠纷。


3

重要图像数字资源之批评


鉴于目前尚有为数不少的研究者仍不熟悉有哪些图像数字资源可供利用,本文将对这些资源做一简要梳理及评论。但考虑到关于中国古代文学、历史、社会等方面的图像资料已极为丰硕,相关数字资源的数量在海内外已有近百种之多,殊难备载,因此下文仅分类简介若干种可查找中国近现代文史研究领域所需图像资料的数据库和网站,聊供读者参考。


其一,海峡两岸暨香港、澳门的图像数字资源。诸如上海图书馆“近代期刊图像数据库”(现已集成于晚清民国期刊全文数据库,可由“全国报刊索引”网站登入)收集了海量的近代期刊所载照片、绘画、书法、木刻、手稿、漫画、地图、雕塑、歌谱、曲谱、石刻、题词、图表、拓片、篆刻等图像资料,也有专门的“图片检索”功能。不过,这一功能仍和前文所述“读秀学术搜索引擎”相同,是基于图片的文字说明而开发的。又如浙江图书馆“中国历代名人图像数据库”、苏州大学图书馆“中国历代名人图像数据库”等,也有不少近现代名家的图像资料。另如香港中文大学图书馆建立的“中国现代文学研究网”“香港文学资料库”“中国现代戏剧资料数据库”,台北中研院历史语言研究所开发的“台湾美术图像与文化解释”数据库等,也可对展开相关研究提供重要图像资料。尤其值得称许的是“抗战文献平台”,该平台由中国社科院近代史研究所发起,系国家社科基金项目“抗日战争研究专项工程”的阶段性成果,目前已收录1949年前的档案、报刊、书籍、图像、音频、视频等各类文献达1700万页以上(截至2019年7月),承诺面向全球读者永久免费开放,所有文献均可免费在线检索、阅览。


其二,国外高校、图书馆开发的图像数字资源。目前,日本东京大学、京都大学、早稻田大学,美国哈佛大学、麻省理工学院、普林斯顿大学、康奈尔大学、杜克大学、华盛顿大学、威斯康辛大学密尔沃基分校、南加州大学、夏威夷大学、乔治梅森大学,以及英国剑桥大学、杜伦大学、布里斯托大学等多所高校图书馆,德国巴伐利亚州立图书馆,澳大利亚国立图书馆等机构已将其所收藏的大量近现代中国图像资料数字化,并建立有专门的网站和数据库,其中绝大多数均免费向全世界读者提供访问下载服务。如京都大学建设有“华北交通档案”(華北交通アーカイブ)数据库和“图片明信片中的亚洲”数据库(絵葉書からみるアジア),公开了日本在抗战时期关于中国华北地区的摄影(近4万张)和侵入亚洲各国时所拍摄的大量照片、绘制的大量图片(其中中国部分近2000张),并有较为详细的著录、标引,向全球用户免费提供高分辨率图片的下载。不过,这些数字资源在检索时,一般要求检索语言为所在国的官方语言,对使用者的语言能力也提出一定的要求。


其三,国外数据库厂商建立的图像数字资源。比较重要的有:


1.Adam Matthew Digital原始文献数据库。英国数据库厂商Sage旗下网站,其数字资源以历史档案、原始资料、珍稀书籍和手稿为主,其中的“中国:文化与社会”(China: Culture and Society)等数据库有大量的近现代中国图像资料,输入人名、地名拼音即可检索。


2.Gale Scholar数据库。美国学术出版商Gale旗下网站,收录15世纪至今世界知名图书馆和个人收藏的成千上万种地图、照片、报纸、期刊和书籍,其“中国与现代世界:传教士,汉学与文学期刊(1817—1949)”(China and Modern World: Missionary, Sinology and Literary Periodicals, 1817-1949)数据库中,就有不少传教士拍摄的近现代中国照片,也支持多种形式的检索。


3.Proquest平台。美国数据库厂商Proquest旗下网站,收录了大量的书籍、期刊论文、学位论文、缩微胶卷、新闻和报纸等类型资料,并提供索引、全文及全文影像,其中的“近现代中国英文报纸库”(Chinese Newspapers Collection, 1832-1953)就有不少可用于近现代研究的图像资料。


4.Granger Academic数据库。美国历史图片数据商Granger旗下网站,收录大量古代中国的美术作品(含古籍插图)和近代以来的摄影作品、报刊和其他宣传物插图资料。与上述三种数字资源只向机构用户提供付费访问、下载权限不同,该网站可供读者免费阅览、下载。只需注册后输入人名、地名等关键词(英文)进行检索,即可查找相关资料,唯一需要注意的是,输入其间的人名、地名,不能是汉语拼音,而需转换为威妥玛式拼音法这一近现代中国曾经通行、港台地区至今仍在使用的注音规则。[4]


当然,除上举若干种较为重要的、适用于近现代文史研究的图像数字资源外,一般意义上的图像数据库、网站已非常之多,尤其值得我们进行系统、深入的整理、研究和批评[5]


4

图像资料的专门研究之举隅


图像资料的专门研究这一问题,从大的方面来讲,仍属于图像资料的利用,不过,其属于深度利用。又因其服务于各自的研究对象和问题意识,在研究中时常也只是配合文字资料使用,因此很难一律而谈,尤其从方法论的角度进行分析。但是,在此笔者仍可以勉强指出四个较为重要的、基础的方面。


其一,无论是数字资源中的图像资料,还是纸质书刊中的图像资料,对其基本信息都需要进行严格的考证和历史考察。以其中的大宗——照片为例,这些基本信息至少包括照片的拍摄者、拍摄的时间、地点、照片中的每一人物。如一项对于1929年7月2日(中文资料多误记为1928年)与罗曼·罗兰合影的东方人是谁的研究,则据法文资料(罗曼·罗兰日记)及其他资料,澄清了此前多认为是《约翰-克里斯多夫》的中文首译者敬隐渔的误会,而指出其为日本作家片山敏彦。[6]另一项对于1948年3月30日所摄、题为“皆兄弟也”的五人合影照片的研究,历时三年,查阅资料百万字,就是为了弄清楚照片中除了胡适、胡先骕之外的其余三人究竟是谁,研究者因此感慨道:“俗话说百闻不如一见,照片所展现的人物形象和精神气质,是多少文字也难以表达的。尤其是通过老照片与文字资料的印证及咬合,还能带来更为丰富的历史现场感。但遗憾的是,老照片上的人物经常会被认错。徐志摩、朱自清的一些重印著作封面上用了胡适小照,吴宓家乡报纸的整版纪念长文中仅有的两张人物照片‘乱入’了青年方玮德与老年陈寅恪,搜索引擎上,外交家张歆海屡屡被误认为宋子文,清华学校校长曹云祥被当成清华大学校长周诒春,而周诒春又常被认作‘身兼三主任、五教授’的温源宁……如此张冠李戴,不胜枚举,显示出今人对前人形象的无知与漠然。”[7]


当然,了解其收藏者、捐赠者、目前的持有者等信息,也可以为深入解读图像资料、展开专门研究提供帮助。如中华艺术大学的旧址,长期以来被确定为上海市多伦路145号,但通过新发现的20世纪30年代的一张该校校门照片,可将其旧址准确地勘定为多伦路201弄2号,而通过对此照片来源的重新考察,研究者顺次不仅纠正了现有记录的错误,也给出了一条图像资料清晰流传的线索。[8]现有的书籍史、印刷史、出版史、藏书史等方面研究,较多重视文字资料,而较少注意图像资料,此例适可补其不足。又如关于桑弧遗物中一束张爱玲照片的研究,则成为了解读二人交谊、战后上海影坛生态包括文华影业公司的成立、发展等问题的新入口。[9]


其二,手稿、手迹类的文献资料,以照片、影本等图像形态存在者,在纸质书刊、互联网和数据库中都很常见,但无论其原件、实物,还是复制件、电子版、照片等,皆有一定的作伪之可能。我们在搜集、整理、研究之时,须有这一方面的认识和准备,甚至是专门研究。如在关于鲁迅、钱锺书、罗振玉、沈尹默等人手札、书法作品的辨伪中,学者和收藏家已经积累了一定的经验,总结出了目前流行的一些作伪的方式方法,[10]但这些经验仍不足以抵御市面上层出不穷、屡见不鲜的伪作泛滥现象。又如北京师范大学图书馆工作人员精心拣选、整理馆藏640余通清人书札,将其结集为《清代名人书札》出版,但在近年来研究者发现有不少伪作亦混迹其间。[11]这使得基于上述伪作基础上的研究论著,顿时成为了学术泡沫。至于通过一本拍卖行图录、一帧旧书网的照片,就轻易地断定其属某人手迹、手稿,据此从事所谓的“辑佚”工作者,就更加常见了。其实,未经考证、辨伪之所谓“辑佚”,不能谓为真正的辑佚研究成果。但由此亦可见出,即便是今天,我们仍有必要强调从实物出发这一文献学研究的基本原则,当然,数字文献的发展也带来了新的问题和挑战。


其三,对图像资料的专门研究,文学史、艺术史和纯粹的历史研究者,各有其侧重,研究方法、学术训练等也有所不同。对此,拙文《现代文学版本及其图像资料的整理、研究》末节曾有极扼要之讨论,但讨论的重心在分疏其差异,实际上,它们之间也有一共同之处,即我们如何读懂一幅图。在这一方面,无论是美术作品,还是历史人物、事件和场景照片,抑或是其他类型的图像资料(如地图、广告、戏单、图表、科学图像等),都需要我们拥有一些共同的、基础的知识或日常生活的“常识”,乃至人文、艺术等领域广博的知识储备和足够的敏感、会心和想象力,当然,这不是一两句话就能说得清楚的,更多的是要在具体的研究实践中去摸索,直至针对不同类型的图像资料,发展出不同的研究方法。


其四,图像资料的专门研究,乃至其检索、初步利用等,似皆有赖于数字人文的发展。如前所述,目前基于文本的图像检索技术,已渐不敷使用,而发展基于内容的图像检索技术,尤其是结合卷积神经网络等人工智能技术,为各种图像数据库、网站建立关联及统一的检索、应用平台等,开拓数据库、平台的图像深度应用功能,以及各高校、科研院所、公私藏机构努力开发更多的数字图像资料等,都是目前及未来可以期待的发展方向。惟其如此,对图像资料的检索、利用与专门研究,乃至基于数字图像的视觉知识生产,才有可能迈向一个新的阶段。这个阶段的到来,固然需要人文学者的专业能力、学养的参与,但很多基础层面的问题(如要弄清楚一副图片是否为“原图”,图片的基本信息有哪些等),可借助一定的算法、模型和机器的自动处理,为我们提供初步的解决方案,此后我们只需对其提供的答案进行验证、判断,把更多的精力放在精细的批评、阐释上来。


5

余论


最后,还有一个问题——如何看待图像资料的检索、初步利用这一工作本身的意义和价值,也许还有必要在此提出,稍作讨论。但对此问题,笔者目前并无新见,只是认为,承认一个事实颇为重要,此即即便我们已经养成了“数字读写能力”,极为精通图像资料的检索方法、技术,也不能保证我们就能够百分之百检索到我们的目标资料。这不仅是因为目前“大量资料尚未被电子化、数字化”[12],同时还由于数字资源本身的脆弱性、不同国家和地区的互联网发展趋势和数据使用政策的差异变化等因素,致使我们即便可以使用数字资源、文献,也不能完全放弃对纸质书刊资料的存藏、阅读与利用。这一事实,似乎既可提醒图书馆从业人员,不必过度迷信、推崇数字资源(以及它所寄身的那个说不清是物理实体还是虚无缥缈的“云”端世界),因纸质文献至少不会像网站和数据库那样,时常出现系统奔溃、服务器响应速度缓慢、甚至突然消失等一系列问题;同时也提醒我们专业研究者,在检索包括图像资料在内的文献资料时,不仅应有目录学、文献学和学术史的基本功,还要对自己所在研究领域的各种纸质文献和数字资源情况有较为全面的了解(即便不是如数家珍),因为这是开展一个有效检索和后续研究的基础。


更为重要的是,它可能还提醒着我们:不管我们的身份、角色和工作领域有何不同,都不必完全依赖数字资源的检索与利用,从而忽略了数千年的人类文明史乃是一部印刷文化和书写文化史这一事实。与触手可及、可获得信息的数字检索实践相比,那些看似传统的研究技艺诸如阅读、理解、思考、写作等也并未过时,毋宁说今天更需要被倍加珍视和呵护。[13]实际上,笔者也对这样一种被许多同行、友人所津津乐道的数字时代的“远大前景”至感忧虑:如果有一天我们不再走进图书馆、书店、艺术馆、博物馆,不再阅读、收藏纸质文献,完全依赖于数字文献和在线漫游,沉浸于一个似乎无所不能的虚拟世界当中,那时的我们将会变成什么模样?从数字人文到机器人人文,我们又将失去什么?其代价是否能够被今天/未来的我们充分预计、承担?[14]彼时我们的文明,又会呈现出什么样的发展状况?那果然是一个值得欣喜、期冀的“黄金时代”吗?


本文原载《印刷文化》(中英文)2021年第3期


[1]丛立:《ProQuest的高级检索功能及检索结果处理功能》,《现代情报》2004年第10期,第216—217页。

[2]赵欢:《基于卷积神经网络和哈希技术的图像检索方法研究》,沈阳工业大学2020年硕士论文。

[3]王贺:《现代文学版本及其图像资料的整理、研究——评黄开发、李今编著〈中国现代文学初版本图鉴〉》,《中国现代文学研究丛刊》2019年第2期,第218—226页。

[4]参见《Granger Academic中国历史照片影像库》,网址见:https://mp.weixin.qq.com/s/LqGuE2dwn5KXlwFkN32N8A,2021年7月15日检索。

[5]关于国内、国外图像数据库和网站的简要考察,请参考孙嘉:《走进国内图像数据库》,《美术观察》2021年第4期,第27—29页;王国强:《网洋撷英:数字资源与汉学研究》,江西高校出版社2020年12月版,第79—94页。

[6]张英伦:《和罗曼·罗兰合影的“敬隐渔”找到了》,《中华读书报》2019年9月25日第14版。

[7]徐自豪:《胡适与谁“皆兄弟也”?》,网址见:http://www.thepaper.cn/uc.jsp?contid=13952930,2021年8月9日检索。

[8]何瑛:《中华艺术大学校门照片来历新探》,《上海鲁迅研究》2021年第1期,第228—233页。

[9]张伟:《导演桑弧遗物中几帧图像的释读——关于张爱玲及文华影业公司》,《现代中文学刊》2019年第5期,第95—103页。

[10]方继孝:《书札的作伪及辨伪》,《博览群书》2010年第9期,第104—108页。

[11]卿朝晖:《〈清代名人书札〉辨伪》,《清史研究》2016年第1期,第152—156页。

[12]王贺:《从“研究资料集”到“专题数据库”》,《苏州教育学院学报》2019年第3期,第90—95页。

[13]王贺:《危机中的意义——再论“目录学向何处去”》,《澳门文献信息学刊》2019年第1期,第51—60页。

[14]王贺:《从数字人文到机器人人文,我们将失去什么?》,《中国社会科学报》2020年12月21日第6版。



延伸阅读



王贺 | “数字人文”与传统学术 ——以《解放日报》目录、索引及数据库为中心

王贺 | 从数字人文到机器人人文,我们将失去什么?

安克强 | 关于《二十世纪上海报刊娱乐广告数据库(1907-1966)》


编辑:刘婷


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存